رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی lda

نویسندگان

بابک مسعودی

دانشگاه پیام نور سعید راحتی

saeid rahati ghochani مشهد دانشگاه آزاد اسلامی

چکیده

ابهام زدایی از واژگان مبهم و دارای معانی متعدد موضوع مهمی در حوزه ی پردازش زبان های طبیعی می باشد. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی بر اساس استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با بکار بردن روش های مدل سازی موضوع بدست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده موضوعات موجود در اسناد یک پیکره است. در مقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله(lda) برای این منظور استفاده کرده ایم. نتایج آزمایشات برای چهار واژه مبهم پر تکرار در زبان فارسی که ازپیکره پژوهشکده پردازش هوشمند علائم استخراج شد، دقّت حدود 97.67% را نشان می دهد که بیان گر مؤثر بودن این روش در یافتن معنی مناسب واژگان مبهم است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA

Word sense disambiguation is the task of identifying the correct sense for the word in a given context among a finite set of possible sense. In this paper a model for farsi word sense disambiguation is presented. The model use two group of features: first, all word and stop words around target word and topic models as second features. We extract topics from a farsi corpus with Latent Dirichlet ...

متن کامل

سامانۀ رفع ابهام معنایی از حروف اضافه در زبان فارسی با استفاده از قالب‌های معنایی

رفع ابهام معنایی از کلمات در بافت یکی از مهم‌ترین چالش‌ها در حوزۀ پردازش زبان طبیعی و زبان‌شناسی رایانشی است. در این میان حروف اضافه، به‌خصوص در زبان فارسی، در پژوهش‌های مربوط به رفع ابهام معنایی همواره نادیده انگاشته شده‌اند. ازاین‌رو، پژوهش حاضر قصد دارد با ارائۀ الگوریتمی جدید مبتنی بر قالب‌های معنایی، سامانه‌ای قاعده‌مند جهت رفع ابهام معنایی از حروف اضافه «از»، «در»، «با» و «تا» در زبان فار...

متن کامل

تحلیل معنایی واژگان مرکب مفعولی در زبان فارسی

       در مقالة حاضر با گردآوری 745 واژة مرکب مفعولی به تحلیل معنایی این دسته از واژگان مرکب نحوی می‌پردازیم. در ارتباط با نقش بیرونی کلمات مرکب مفعولی می‌توان به تعمیمی‌ دست یافت؛ بدین ترتیب که به طور عمده در طبقة صفات قرار می‌گیرند، هر چند تعدادی اسم نیز در این میان مشاهده می‌شود. همچنین بررسی معنایی واژگان مرکب مفعولی حاکی از آن است که این دسته از واژگان از دلالت برون‌زبانی (مصداقی) برخوردار...

متن کامل

بررسی تحول معنایی واژگان دخیل عربی در زبان فارسی.

چکیده: در این مقاله به بررسی تغییر و تحولات واژگان دخیل عربی که در فرهنگ بزرگ سخن بسیاری از آن‌ها ذکر شده‌اند، پرداخته‌ایم. این تغییرات در سطح معنایی توصیف و طبقه‌بندی می‌شود. در حین این انتقال، تعداد زیادی از واژگان عربی با مدلول‌های اصلی و اولیة خود در زبان عربی، وارد زبان فارسی شده و در زبان مردم جاری و ساری گشته‌اند؛ اما معنا و مدلول اولیة خود را از دست داده و معنای جدیدی گرفته‌اند؛ م...

متن کامل

تحلیل معنایی واژگان زبان فارسی بر مبنای رویکرد معنی‌شناسی قالب‌بنیاد

معنی‌شناسی قالب‌بنیاد نخستین بار از سوی چارلز فیلمور و پس از طرح مفهوم «قالب» از سوی او (1977الف، 1977ب، 1985، 1987) به‌مثابۀ نگرشی در چهارچوب معنی‌شناسی شناختی مطرح شد. فیلمور در این رویکرد واژگانی، اصطلاح «قالب» را به‌مثابۀ شیوه‌ای برای تحلیل‌های معنایی زبان طبیعی به کار می‌برد. نگارندۀ نوشتۀ حاضر با استفاده از نمونه‌های متعددی از زبان فارسی معیار به ارزیابی میزان کارایی این نظریه در زبان فار...

متن کامل

بررسی جایگاه واژگان مصوبِ فرهنگستان زبان و ادب فارسی در فهرست سرعنوان‌های موضوعی فارسی

فرهنگستان زبان و ادب فارسی، به عنوان مرجعی ملی و معتبر در زمینه معادل­یابیِ واژگان بیگانه، ضمن انتشار فهرستی از واژگان مصوب فرهنگستان، به منظور رفع تشتّت و ایجاد هماهنگى در فعالیت‌هاى مراکز فرهنگى و پژوهشى در حوزۀ زبان و ادب فارسى، کلیه سازمان­های دولتی را به پیروی و استفاده از واژگان یادشده فراخوانده است. در این بین، نقش کتابخانه ملی، نَه صرفاً به عنوان کتابخانه مادر، که به دلیل نقشی که در تدوین و...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
پردازش علائم و داده ها

جلد ۱۲، شماره ۴، صفحات ۱۱۷-۱۲۵

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023